Etiquetado de metáforas lingüísticas en un conjunto de documentos en español
نویسندگان
چکیده
This paper introduces the work performed to manually label linguistic metaphors in the document collection of SemEval 2013, in the Spanish lexical disambiguation task. The objectives of this work are two: first, to make a prior identification of the difficulties inherent in metaphor detection in Spanish, and second, to generate a new linguistic resource as a collection of Spanish documents with certain terms label with both, the literal and the metaphoric sense.
منابع مشابه
Categorización automática de documentos en español: algunos resultados experimentales
Resumen. La categorización automática puede contemplarse como un proceso de aprendizaje, durante el cual un programa capta las características que distinguen cada categoría o clase de las demás, es decir, aquéllas que deben poseer los documentos para pertenecer a esa categoría. De otro lado, pocos experimentos se han efectuado todavía con documentos en español. Se muestran las posibilidades de ...
متن کاملUna Propuesta para el Etiquetado Automático de Roles Semánticos
Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...
متن کاملClasificación automática de la orientación semántica de opiniones mediante características lingüísticas
Resumen. En este trabajo examinamos el problema de clasificar la orientación semántica de opiniones de productos comerciales, en idioma Español. Exploramos las características de la colección de opiniones extraídas de Internet y estudiamos el uso de bigramas de afirmación como características de entrenamiento para un método supervisado. Analizamos la combinación de estas características y medim...
متن کاملEl proyecto METAe (Meta-data Engine Project): concepto, implementación e integración en bibliotecas digitales
Resumen. La necesidad de digitalizar documentos impresos requiere la creación de herramientas y estándares que ayuden en esta tarea. El consorcio internacional del proyecto METAe del V programa marco de la Unión Europea ha desarrollado la herramienta Metadata Engine que aporta una solución integrada de digitalización, OCR, y etiquetado XML de textos. Mediante una sencilla interfaz, el usuario g...
متن کاملWWW como fuente de recursos lingüísticos para su uso en PLN
Resumen Crear un corpus extraído a partir de la Web está lejos de ser una tarea trivial. El elevado grado de heterogeneidad que es usual encontrar en el formato HTML, la gran cantidad de información irrelevante tanto en el sitio Web como dentro de una misma página y otros problemas de diversa índole, dificultan la obtención de un conjunto de documentos de aspecto homogéneo, estructurado y libre...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 53 شماره
صفحات -
تاریخ انتشار 2014